为什么LLM的应用大爆发还没有出现?
NOW: LLM的应用大规模爆发还没有迹象
自从chatGPT在去年11月30日发布至今,生态里的每一个玩家都高度关注这个大爆发的进程:
VC和各类创业者疯狂地交流,头脑风暴,试图找到The next big thing的迹象。毕竟这是继移动互联的大规模增长后,科技创投圈的全村的希望——村里的Web3, metaverse, NFT都努力过了。
中小企业在媒体宣传下,也在关注各种可以用来降本增效或者提升自己业务销售的工具;我最熟悉的MNC板块也异常的活跃(考虑到合规本身对跨国企业有压力):不仅是leadership有FOMO,management和业务第一线的专家都有自下而上的驱动来研究LLM的可能应用。
有些动力是来自行业中其他玩家带来的peer competition。有些动力是想找到帮助自己每天工作的助力;有些则是想提前看到自己的工作会不会被AI代替。
但是,现在已经是2023年8月1日了。大家期待的LLM寒武纪爆发——可规模化的PMF(Product-Market Fit),尚未出现明显的迹象。上述的各位可以看看自己身边,除了ChatGPT这个全球第一个LLM-native APP本身以外,还有什么其他AI产品是你每天都会用?大家在各个领域,有遇到“用了就回不去了”的LLM产品么?
不用担心这只是“自己身边的观察”,我在和美国,欧洲和亚洲市场的不同玩家交流后,得到的答案和大家一样:现在没找到像移动时代那样标志性的产品。
我和大部分从业人员一样,相信LLM最终会带来很大一波应用。We could say that 我们可能需要更多的时间,就像自从Appstore发布以后(2008年),iOS的杀手级应用如Angry Birds, WhatsApp, Instagram,也是经历了1年多时间开始有流量(2010-2011)。这是一个开头的迹象,然后大规模采用,则是在2012-2014年出现的(超过了100万个APP)。
但另一方面,这些“更多的时间”是用来干什么的?什么东西的出现会加速这个进程呢?
还差什么: 产品形态 & 供给
在2B方面,影响找到PMF的因素很多,比如合规:因为LLM的特点(数据都得走一遍大模型),大型企业出于合规的顾虑,导致业务和IT同事更难在企业内的探索业务场景,发现好场景的时间被拉长。
不过,这个问题并不对2C的创新型企业有效——他们并没有那么多合规顾虑,理论上可以任意探索场景。那为什么新的killer APP在2C领域也没有出现呢?
1) 缺少一种有效的产品形态
当前的LLM领域,开发者还没有找到合适这个技术的产品形态——我称为Tech-Product Fit。
有朋友可能还没分清楚:LLM本身是一种技术,而非产品。ChatGPT才是(面向消费者)产品。
而从一个技术到一个终端消费者可用的产品,这中间还隔了很多东西。这意味着ChatGPT本身作为LLM-native的应用,其内部远远不止GPT(LLM)本身,还有很多其他技术组件和系统(而且并未全面向公众公开)。
比如把内燃机看做一种技术,那么汽车就是产品;如果多点触控是一项技术,那么iphone就是产品。
所以,当开发者们拿到LLM的接口的时候,就好像拿到了一个已经封装好的引擎——而这离造出一辆可以卖给消费者使用的车,还差很多组件和相关技术。
而缺少组件,这还不是当前摆在全球开发者最面前的问题。更大的问题是:“什么是车?”——开发者得先知道自己要造车,才(可能)知道还缺少哪些组件。
这些components的存在、组织方式、运作机制加在一起,就是产品形态(Product Form)的框架(Framework)。
同一个产品形态的框架, 可以做出很多近似,但各有特色的产品。就好像,汽车这类产品,除了都有发动机以外,还有变速器、制动系统、轮胎、转向系统、车身等等,加在一起就是“汽车框架”。在这个统一框架下,开发者不用再重复验证“汽车是有用的”,也不用重新探索“需要哪些部件才能造出车”;开发者可以只关注对“汽车”这个框架下的不同组件的创新和设计,制造出不同性能和功能的车,以满足不同消费者的需求。
在PC时代,最优的产品形态是桌面端软件;互联网时代的产品形态是Website;移动时代的产品形态是APP;当LLM的这一刻出现的时候,我们就有机会看到应用的大爆发了——只是可能还缺了一个重要因素。
2) 缺少业务端供给
真正的魔法不是交互,而是交付:只有业务交付才能带来真正的价值(和交易)——这就好像你在uber上下单了,一会儿真的来了一辆车。并不是只有在物理世界里的交付才算交付,在社交网站上,真的认识到人,也算(社交网站的)交付。
关键的问题是,如果交付是信息类的,比如知识,而且还是常识类的知识,那么多半这个交付可以由LLM本身完成。所以,要让终端用户感觉到你的产品有价值,那么完成交付的就不能是LLM本身。比如有开发者在LLM上套个皮(wrapper)就称为产品了,那么就没有你的add value,用户大可直接去用ChatGPT。
2016年,我关闭了一个2C的创业(智能助理)。当时有一个总结,是只要不能实现供给,智能助理最终都无法形成规模化的价值。当时称之为“API困境”,核心的意思是“你做的AI能推荐餐厅,但不能预定餐厅,就没有足够大的商业意义”——甚至你不会感觉这个技术有什么用。感兴趣的朋友可以去看《为什么你看到智能助理都像人工智障》。
到当前LLM时代,这个核心依然成立。LLM解决了自然语言理解的问题,但是并未解决供给端的业务逻辑(特别是私有的领域逻辑),更没有也不能解决供给侧的交付问题。
这意味着,你对AI说,“点4杯热拿铁送到办公室”,你会真正觉得有价值的是过了一会,热拿铁真的出现在了办公室。而这个过程中除了理解你表达出来的需求,还有很多环节的业务逻辑需要被执行(库存服务、身份识别、地理位置处理、支付、店员查看订单系统、店员制作你的那杯在物理世界真实存在的拿铁、派单给快递系统等等),才能最终让快递员把咖啡给你送上门。以上这些业务逻辑的设计与执行,都与LLM没有什么关系,而是符号系统(也就是传统软件)和人的事情。
所以,我们要想看到LLM在遍地开花,还需要全球开发者在拿到LLM的接口后,去设计业务(业务逻辑是什么?业务怎么交付?)才能真正给终端消费者传达有效的价值。
最后
可以想象未来可能的业务是非常多样的:incumbents可用LLM来翻新或者改善交互(如copilot);也会有新的业务借由新的产品形态出现。
至于这个LLM-native的产品形态是什么,我的答案是: Agent, but not Autonomous Agent.